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fs| (57) Abstract: The invention relates to a method and a device for determining an acoustic environment situation. The method con- 
sists of processing an acoustic input signal (IN) that is preferably picked up with the help of at least one microphone in at least two 
processing stages (SI, .... Sn). At least one of the two processing stages (SI, Sn) comprises an extraction phase in which char- 

fs| acteristic features are extracted from the input signal (IN) and each of the processing stages (SI, .... Sn) comprises an identification 
phase in which extracted characteristic features are classified. Class infonnation (KIl, Kin; KU*. .... Kin*) characterising or 

O identifying the acoustic environment situation is generated based on the classification of said features in at least one processing stage 
^ (SI, .... Sn). The invention also relates to applications of the inventive method in hearing aids and to a hearing aid. 

^ [Fortsetzung auf der n^hsten SeiteJ 
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TM), euiopaisches Patent (AT, BE, CH, CY. DE, DK, 
ES. n, FR, GB, GR, IE. IT, LU, MC, NL, PT, SE, TR). 
OAPI-Patent (BF, BJ. CF, CG. CI, CM. GA. GN, GQ, GW. 
ML. MR, NE, SN. TD, TG). 

Verdfrentlicht: 

— aufAntrag des Anmelders, vor Ablauf der nach Artikei 21 
Absatz 2 Buchstabe a geltenden Frist 

— ohm intermtionalen Recherchenberichi und emeut zu 
verdffentlichen nach Erhalt des Berichts 



ohm Klassifikation; Zusammenfassung und Bezeichnung 
von der IniemcUimakn Recherchenbehdrde nicht Uber- 
prUft 



Zur ErklSrung der Zweibuchstaben-Codes und der anderen 
AbkHrzungen wird auf die ErklOrungen ^Guidance Notes on 
Codes and Abbreviations'^ am Aftfangjeder regulOren Ausgabe 
der PCT-Gazette verwiesen. 



(57) ZusammeDfassung: Ein Verfahren und eine Vorrichtung zur Bestimmung einer akustischen Umgebungssituation sind angege- 
ben, wobei das Verfahren darin besteht, dass in mindestens zwei Verarbeitungsstufen (SI. Sn) ein vorzugsweise mit Hilfe mindes- 
tens eines Mikrofons aufgenommenes akustisches Eingangssignal (IN) verarbeitet wird. und zwar derart, dass in mindestens einer 
der mindestens zwei Verarbeitungsstufen (SI, Sn) eine Extiaktionsphase voigesehen ist, in der chaiakteiistische Meikmale aus 
dem Eingangssignal (IN) extrahiert werden, und dass in jeder Veraibeihingsstufe (SI, Sn) eine Identifikationsphase vorigesehen 
ist, in der extrahierte charakteristische Mericmale klassifiziert werden. Aufgrund der Klassifizierung der Merianale in mindestens 

einer Verarbeitungsstufe (SI Sn) werden Klasseninformationen (KIl Kin; Kir, .... Kin*) erzeugt. welche die akustische 

Umgebungssituation charakterisieren bzw. identifiziert. Des weiteren sind Anwendungen des erfindungsgemSssen Verfiahrens bei 
Horhilfeger^n und ein Hdihilfegerat angegeben. 
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Verfahren zur Bestimmung einer akustischen 
Umgebungs situation/ Anwend\mg des Verf ahrens und ein 
Horhilfegerat 

5 ' : 

Die .vorliegende Erfindung betriff t ein Verfahren zur 
Bestimmung einer akustischen Umgebungssituation, eine 
Anwendung des Verf ahrens, eine Vorrichtung zur Bestimmung 
der akustischen Umgebungssituation sowie ein 
10 Horhilfegerat. 

Moderne Horgerate konnen haute mit Hilfe verschiedener 
Horprogramme unterschiedlichen akustischen 
Umgebungssituationen angepasst werden... Damit soli das 
15 Horgerat dem Benutzer in jeder situation einen optimalen 
Nutzen bieten. 

Die Wahl des Horprogramms kann entweder uber die 
Fernbedienung Oder uber einen Schalter am Horgerat selbst 

20 vorgenommen werden. Das Umschalten zwischen verschiedenen 
Horprogrammen ist jedoch fvir viele Benutzer lastig oder 
schwierig, wenn nicht sogar unmoglich. Welches Programm zu 
welchem Zeitpunkt den optimalen Komfort und die beste 
Sprachverstandlichkeit bietet, ist auch fiir versierte 

25 Horgeratetrager nicht immer einfach zu bestimmen. Bin 

automatisches Erkennen der. akustischen Umgebungssituation 
und ein damit verbundenes automatisches Umschalten des 
Horprogramms im Horgerat ist daher wiinschenswert . 



BESTATIGUNGSKOPIE 
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Es sind derzeit verschiedene Verfahren fur die 
automatische Klassif izierung vori. akustischen 
Umgeb\mgssituationen bekannt. Bei all diesen Verfahren 
werden aus dem Eingangssignal, das beim Horgerat von einem 
5 Oder mehreren Mikrofonen statnmen kann, verschiedene 

Merkmale extrahiert. Basierend auf diesen Merkmalen trifft 
ein Mustererkenner unter Anwendung eines Algorithmus eine 
Entscheidung uber die Zugehorigkeit des analysierten 
Eingangssignals zu einer bestimmten akustischen 

10 Umgebungs situation. Die verschiedenen bekannten Verfahren 
unterscheiden sich dabei einerseits durch die 
xinterschiedlichen Merkmale, welche bei der Beschreibung 
der akustischen Umgebungs situation verwendet werden 
(Signalanalyse) , und andererseits durch den verwendeten 

15 Mustererkenner der die Merkmale klassif iziert 
(Signalidentif ikation) . 

Aus der Verof f entlichung der internationalen 
Patentanmeldung mit dem Veroff entlichungsaktenzeichen WO 

20 01/20 965 sind ein Verfahren sowie eine Vorrichtung zur 

Bestimmung der akustischen Umgebungs situation bekannt. Es 
handelt sich dabei urn eine einstuf ige Verarbeitung eines 
akustischen Eingangssignals in einer 
Merkmalsextrakticnseinheit und einer dieser 

25 nachgeschalteten Klassif izierungseinheit, in der die 
extrahierten Merkmale zur Erzeugung von 
Klasseninformationen klassif iziert werden. Mit der 
bekannten Lehre werden zwar, insbesondere bei Verwendung 
von auditorisch-basierten Merkmalen, gute Resultate 

30 erhalten. Bine Verbesserung wird aber insbesondere im 

Anwendungsbereich von Horhilf egeraten gewunscht, da gerade 
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in diesem Anwendungsgebiet die Klassif ikation von 
akustischen Umgebungs situation aussert akkurat sein muss. 
Gleichzeitig bereitet das Vorhandensein von mehreren, sehr 
allgemeinen Gerauschklassen, wie Musik oder Rauschen, 
einige Schwierigkeiten. So entspricht es der Natur dieser 
Gerauschklassen, dass sie . sehr allgemein und breit, d.h. 
in vielfal tiger Weise auftreten konnen. Die Gerauschklasse 
Rauschen, zum Beispiel, enthalt die unterschiedlichsten 
Gerausche wie Hintergrixndgesprache, Bahnhof gerausche , 
Haartrockner, und die Gerauschklasse Musik beinhaltet 
Popmusik, klassische Musfik, Einzelinstrumente, Gesang, 
usw. 

Gerade auf grund der sehr allgemeinen Natur dieser 
Gerauschklassen ist es aber sehr schwierig, eine gute 
Erkennungsrate mit Hilfe der bekannten 

Verarbeitungsmethode in eine Merkmalsextraktionseinheit 
und einer nachgeschalteten Klassif izierungseinheit zu 
erhalten. Zwar kann die Robustheit des Erkennungssystems 
durch eine gee ignete Wahl von Merkmalen verbessert werden, 
wie dies in WO 01/20965 erstmals aufgezeigt worden ist, 
indem auditorisch-basierte Merkmale verwendet werden, doch 
ist es insbesondere aufgrund einer hohen Varianz zwischen 
allgemeinen Gerauschklassen schwierig, diese klar und 
zweifelsfrei voneinander zu unterscheiden . 

Der vorliegenden Erf indung liegt daher die Aufgabe ■ 
zugrunde, ein Verfahren zur Bestimmung einer akustischen 
Umgebungssituation anzugeben, das gegeniiber deri bekannten 
Verfahren robuster und genauer ist. 
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Diese Aufgabe wird durch die in Anspruch 1 angegebenen 
Massnahmen gelost. Vorteilhafte Ausgestaltiingen der 
Erfindung, eine Anwendung des Verfahrens, eine Vorrichtmg 
5 sowie ein Horhilfegerat sind in weiteren Anspriichen 
angegeben. 

Indem ein akustischen Eingangssignal in einem mehrstufigen 
Verfahren, das aus mindestens zwei Klassif izi-eirungsstufen 

10 besteht, wobei jede Stufe vorzugsweise aus einer 

Extraktionsphase imd einer Identif ikationsphase besteht, 
verarbeitet wird, wird eine iiberaus robuste und genaue 
Klassif ikation der momentanen akustischen 
Umgebungs situation erhalten. So kann mit dem 

15 erf indungsgemSssen Verfahren beispielsweise eine falsche 
Klassif izierung von Popmusik in die Kategorie "Sprache in 
Gerausch" erfolgreich vermieden werden. Das 
erf indungsgemasse Verfahren ermoglicht ferner die 
Unterteilung einer allgemeinen GercLuschklasse, 

20 beispielsweise Rauschen, in Unterklassen, wie 

beispielsweise Verkehrslaann oder Gesprachshintergrundlarm. 
Spezielle Situationen, wie sie beispielsweise im Innem 
eines Automobiles auftreten ("in-the-car noise"), konnen 
ebenfalls erkannt werden. Ganz allgemein kdnnen 

25 Raumeigenschaf ten identif iziert und entsprechend bei der 
Weiterverarbeitung von wichtigen Signalanteilen 
mitberiicksichtigt werden. Es hat sich gezeigt, dass mit 
dem erf indungsgemassen Verfahren es zudem moglich ist, die 
Larmquellen zu lokalisieren, womit die Moglichkeit 

30 geschaffen worden ist, das Vorhandensein einer 
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spezifischen Larmquelle in mehreren anderen Larmquellen zu 
detekfcieren. 

Die Erfindung wird nachfolgend anhand von Zeichnungen 
5 beispielsweise naher erlautert. Dabei zeigen: 



Fig. 1 eine bekannte einstufige Vorrichtung zur 

Bestimmung einer akustischen Umgebungssituation, 



10 Fig. 2 eine erste Ausfuhrxingsform einer 

erf indungsgemassen Vorrichtung mit zwei 
Ver ar be i tung s s t uf en , 



Fig. 3 eine zweite, allgemeine Ausfiihrungsform einer 
15 erf indungsgetnassen mehrstufigen Vorrichtung, 



Fig. 4 eine dritte, allgemeine Ausfuhrungsfoirm einer 
erf indungsgemassen mehrstufigen Vorrichtung, 



20 Fig. 5 eine vierte, allgemeine Ausfiihrungsform einer 
erf indungsgem&ssen mehrstufigen Vorrichtung, 



Fig. 6 eine gegeniiber der zweistufigen Ausfiihrungsform 
gemass Fig. 2 vereinfachte Ausfuhrungsform und 



25 



Fig. 7 ein Horhilfegerat mit einer erf indungsgemassen 
mehrstufigen Vorrichtiing gemass Fig. 2 bis 6. 



wo 02/32208 



- 6 - 



PCT/CH02/00049. 



Fig. 1 zeigt eine bekannte einstufige Vorrichtung zum 
Bestitnmen der akustischen Umgebungssituation, wobei die 
Vorrichtung aus einer Hintereinanderschaltving von einer 
Merkmalsextraktionseinheit F, einer 
Klassifizierungseinheit C und einer 
Nachverarbeitungseinheit P besteht. 

Bin akustisches Eingangs signal IN, das beispielsweise mit 
einem Mikronfon aufgenommen vmrde, ist der 
Merkmalsextraktionseinheit F beauf schlagt , in der 
charakteristische Merkmale extrahiert warden. 

F\ir die Merkmalsextraktion in Audiosignalen wurde im 
Aufsatz von J. M. Kates mit dem Titel '"Classification of . 
Background Noises fiir Hearing- Aid Applications" (1995, 
Journal of the Acoustical Society of America 97(1), Seiten 
461 bis 469) vorgeschlagen, eine Analyse der zeitlichen 
Pegelschwankiangen und des Spektrums vorzunehmen. Des 
weiteren vmrde in der Buropaischen Patentschrif t mit der 
Nummer EP-Bl-0 732 036 eine Analyse des 
Atnplitudenhistogramms zur Erreichung des gleichen ziels 
vorgeschlagen. Schliesslich wurde die Merkmalsextraktion 
auch durch eine Analyse verschiedener 
Modulationsfrequenzen vmtersucht und angewendet. 
Diesbeziiglich wird auf die beiden Aufsatze von Ostendorf 
et. al. mit den Titeln "Empirische Klassif izierung 
verschiedener akustischer Signale und Sprache mittels 
einer Modulationsf requenzanalyse" (1997, DAGA 97, Seiten 
608 bis 609) und "Klassif ikation von akustischen Signalen 
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basierend auf der Analyse von Modulations spektren zur 
Anwendung in digitalen Horgeraten" (1998, DAGA 98, Seiten 
402 bis 403) verwiesen. Ein lihnlicher Ansatz ist auch in 
einem Aufsatz von Edwards et. al. mit dem Titel "Signal- . 
processing algorithms for a new sof ware -based, digital 
hearing device" (1998, The Hearing Journal 51, Seiten 44 
bis 52) offenbart. Weitere m6gliche Merkmaile sirid der . 
Pegel selbst oder die Nulldurchgangsrate wie z.B. in H. L. 
Hirsch, "Statistical Signal Characterization" (Artech 
House 1992) beschrieben. Die bisher zur Audiosignalanalyse ' 
verwendeten Merkmale sind also rein technisch-basiert . 



Des Weiteren wurde in der bereits zitierten 
Offenlegungsschrift der internationalen Patentanmeldung WO 
01/20965 neben den erwahnten technischen Merkmalen 
erstmals auf die vorteilhafte Verwendung von auditoriscb- 
basierten Merktnalen hingewiesen. 

Gemass Fig. 1 warden die in der Merkmalsextraktionseinheit 
F extrahierten Merkmale M der Klassif izierungseinheit C' 
beaufschlagt, in der fur die Gerauschklassifikation 
grundsatzlich einer der bekannten . 

Musteridentifikationsinethoden zum Einsatz kommt. So eignen 
sich insbesondere so genannte JUastandsschatzer , Bayes 
Klassif izierer, Fuzzy Logic Systeme Oder Neuronals 
Netzwerke als Mustererkenner . Weitere Inf ormationen zu den 
zwei erst genannten Methoden konnen der Druckschrift 
"Pattern Classification and Scene Analysis", von Richard O. 
Duda und Peter E. Hart (John Wiley. & Sons, 1973) entnoramen 
werden. Beziiglich Neuronalen Netzwerken wird auf das 
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Standardwerk von Christopher M. Bishop mit dem Titel 
"Neural Networks for Pattern Recognition" (1995, Oxford 
University Press) verwiesen. Des weiteren wird auf die 
folgenden Publikationen verwiesen: Ostendorf et. al.y- 
"Klassif ikation von akustischen Signalen basierend auf der 
Analyse vcn Modulationsspektren zur Anwendung in digitalen 
Horgeraten" (Zeitschrift fur Audiologie, 1998, Seiten 148 
bis 150) ; F. Feldbusch, "Gerauscheerkennung mittels 
Neuronaler Netzwerke" (1998, Zeitschrift fiir Audiologie, 
Seiten 30 bis 36) ; Europaische Patentanmeldung mit der 
Veroffentlichungsnummer EP-Al-0 814 636; und US-Patent mit 
der Veroffentlichungsnummer US-5 604 8l2. Neben den 
erlauterten Mustererkennungsmethoden,. bei denen lediglich 
die statischen Bigenschaf ten der interessierten 
Gerauschklassen modelliert werden, sind in der bereits 
zitierten Of f enlegungsschrif t' der intemationalen 
Patentanmeldung WO 01/20965 auch. Methoden genannt, bei 
denen dynamische Bigenschaf ten beriicksichtigt werden: 

Gemass Fig. 1 werden durch die in der 
Klassifizierungseinheit C durchgefiihrten 

Verarbeitvmgsschritten Klasseninf ormation KI erhalten, die 
gegebenenfalls einer Nachverarbeitungseinheit P zur 
allfalligen Bereinigung der Klassenzugehorigkeit zugefiihrt 
werden. Erhalten werden in der Folge bereinigte 
Klasseninf ormationen KI ' . 

In Fig. 2 ist eine erste Ausfiihrungsvariante einer 
erfindungsgemassen Vorrichtung dargestellt. Es handelt 
sich dabei urn eine Vorrichtung mit zwei Verf ahrensstufen 
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SI und S2, wobei in jeder Verfahrensstuf e SI, S2 je eine 
Merkmalsextraktionseinheit Fl bzw. F2 und eine 
Klassifizierungseinheit CI bzw. C2 enthalten sind. Beiden 
Verfahrensstuf en SI bzw. S2 wird das originare 
5 Eingangs signal IN zugefuhrt, namlich sowohl der 
Merkmalsextraktionseinheit Fl als auch der 
Merkmalsextraktionseinheit F2, die je fur sich mit der 
. entsprechenden Klassifizierungseinheit CI bzw. C2 in der 
Folge wirkverbunden sind. Von Bedetitung ist nun, dass 
10 Klasseninformationen KIl, welche aufgrund von Berechniingen 
in der Klassifizierungseinheit CI der ersten 
Verfahrensstufe SI erhalten werden, die 

Klassifizierungseinheit C2 der zweiten Verfahrensstufe S2 
beeinflusst wird, und zwar derart, dass beispielsweise 
15 einer von niehreren moglichen Musteridentif ikationsmethoden 
ausgewahlt wird und fur die Gerauschklassif izierung in der 
Klassifizierungseinheit C2 der zweiten Verfahrensstufe S2 . 
angewendet wird. 

20 Die allgemeine in Fig- 2 dargestellte Ausfiihrungsvariante 
der Erf indung wird im Folgenden an einem konkreten 
Beispiel weiter erlautert : 

Durch die Merkmalsextraktionseinheit Fl werden die 
25 Merkmale Tonalitat, spektraler Schwerpunkt (CGAV: spectral 
center of gravity) , Fluktuation des spektralen 
Schwerpunkts (CGFS) und spektrale Breite und 
Einschwingzeit extrahiert und in der 

Klassifizierungseinheit CI, in der ein HMM- (Hidden Markov 
30 Model) -Klassifizierer zum Einsatz kommt, klassif iziert , 
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wobei das Eingangs signal IN mit Hilfe der HMM- 
Kassifizierung in eine der folgenden Klassen eingeteilt 
wird: "Sprache", "Sprache in Rauschen", "Rauschen" oder 
"Musik". Dies wird als Kiasseninformation KI bezeichnet. 
Das Resultat der ersten Verarbeitungsstufe SI wird der 
Klassifizierungseinheit C2 der Verarbeitungsstufe S2 
beaufschlagt, in der ein zweites Merknialset mit Hilfe der 
Merkmalsextraktionseinheit .F2 extrahiert wird,. Dabei 
warden neben den Merkmalen Tonalitat, spektraler 
Schwerpunkt lond Fluktuation des spektralen Schwerpunkts 
(CGFS) das zusttzliche Merkmal Varianz der harmonischen 
Struktur (pitch) - nachfolgend auch etwa als Pitchvar 
bezeichnet - extrahiert. Aufgrund dieser Merkmale wird rait 
Hilfe eines Regel-basierten Klassif izierers in der 
Klassifizierungseinheit C2 das Resultat der ersten 
Verarbeitungsstufie SI uberpriift und gegebenenfalls 
korrigiert. Der Regel-basierte Klassif izierer beinhaltet 
lediglich wenige einfache heuristische Bntscheidungeh, 
welche auf den vier Merkmalen basieren vind sich an den 
folgenden Uberlegungen orient ieren: 

Das Merkmal Tonalitat wird in jeder Klasse zur Korrektiir 
verwendet, falls die Merkmalswerte vollstandig ausserhalb 
eines zuiassigen Wertebereiches der Klasseninformationen 
KIl liegen, welche in der ersten Klassif iziervmgseinheit 
CI - d.h. durch den HMM-Klassif izierer - bestimmt worden 
sind. Erwartungsgemass ist die Tonalitat fur "Musik" hoch, 
fiir "Sprache" im mittleren Bereich, fiir "Sprache in 
Rauschen" ein wenig tiefer und fiir "Rauschen" tief . Falls 
beispielsweise ein Eingangssignal IN durch die 
Klassifizierungseinheit CI in die Klasse "Sprache" fallt, 
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dann wird erwartet, dass entsprechende Merkmale , welche in 
der Merkmalsextraktionseinheit Fl ermithelt worden sind, 
der Klassifizierungseinheit CI angezeigt haben, dass der 
relevante Signalanteile im Bingangssignal IN stark • 
5 fluktuiert. Falls, auf der anderen Seite, die Tonalitat 
f\ir dieses Bingangssignal IN sehr tief isfc,, handelt es 
sich mit gross ter Wahrscheinlichkeit nicht um "Sprache", 
sondem um "Sprache in Rauschen". Ahnliche dberlegungen 
konnen fur die anderen drei Merkmale angestellt werden, 

10 namlich fur die Varianz der hanhonischen Struktur 

. (Pitchvar) , den spektralen Scherpunkt (CGAV) und f\ir die 
Fluktuation des spektralen Schwerpunkts (CGFS) . 
Entsprechend konnen die Regeln fur den Regel-basierten 
Klassif izierer, welche in der Klassif izierxmgseinheit C2 

15 zur Anwendung kommen, wie folgt formuliert werden: 
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Klassenizifonnation 
KIl: 


Bedingung : 


Klasseninf ormabion 


"Sprache" 


Falls Tonalitat tief 
falls CGFS hoch 
und CGAV hoch 
ansonsten 


"Sprache in Rauschen*' 

"MUSiK 

"Rauschen" 


"Sprache in Rauschen" 


Falls Tonalitat hoch 
falls Tonalitat tief 

oHfar* t?GAV hoch 


"Sprache" 
"Rauschen" 


"Rauschen" 


Falls Tonalitat hoch 


"Musik" 


"Musik" 


Falls Tonalitit tief . 
Oder Pitch-^/ar tief 
Oder hoch 


"Rauschen" 



Bel dieser Ausfiihrungsf orm der Erfindung hat sich in 
uberraschender Weise herausgestellt , dass nahezu die 
gleichen Merkmale in der zweiten Verarbeitungsstufe S2 
5 verwendet warden wie in der ersten Verarbeitungsstufe SI. 
Es hat sich daruber hinaus gezeigt, dass sich das Merkmal 
Tonalitat am besten signet, um eine Korrektur der durch 
die Klassifizierungseinheit CI erzeugten Fehler 
korrigieren zu konnen. Es kann also festgehalten werden, 
10 dass bei Verwendung des Regel-basierten Klassifizierers 
die Tonalitat von entscheidender Bedeutung ist. 

Beim Austesten der vorstehend beschriebenen 
Ausfuhrvmgsform konnte festgestellt werden, dass bereits 
15 bei diesem einfachen zweistuf igen Verfahren die 
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Tref ferrate mindestens um 3% gegeniiber deni einstufigen 
Verfahren verbessert werden kormte. In einigen Fallen 
konnte sogar eine Verbesserung der Trefferrate um 91% 
festgestellt werden. 

In Fig. 3 ist eine weitere Ausfiihrungsform in allgemeiner 
Darstellung gezeigt. Es handelt sich dabei um ein 
Verarbeitungsverfahren mit n Stufen. Jede der 
Verarbeitungsstufen SI bis Sn weist in Fortfvihrung der 
vorstehenden Uberlegungen eine Merkmalsextraktionseinheit 
Fl bis Fn und eine dieser nachgeschalteten 
Klassifizierungseinheit CI bis Cn zur Erzeugung der. 
jeweiiigen Klasseninf ormationen KIl bis Kin auf . 
Gegebenenfalls ist in jeder oder in einzelnen 
Verarbeittingsstufen Si bis Sn eine 

Nachverarbeitungseinheit Pi bis Pn zur Erzeugung von 
bereinigten Klasseninf ormationen KIl • bis. Kin' vorhanden. 

In Weiterfvihrung der Ausfuhrungsvariante gemass Fig. 2 
eignet sich die in Fig. 3 gezeigte Ausfuhrungsvariante. 
insbesondere auch fur eine sogenannte grob-fein 
Klassif izierung. In einer grob-fein Klassif izierung wird 
ein in einer Verarbeitungsstuf e i erhaltenes Resultat in 
einer nachf olgenden Verarbeitungsstuf e i+1 verfeinert. Es 
wird also eine Grobklassif izierung in einer ubergeordneten 
Verarbeitungsstuf e vorgenommen, wobei aufgrund der 
Grobklassif izierung eine Feinklassif izierung, basierend 
auf spezifischeren Merkmalsextraktionen und/oder 
Klassif izierungsmethoden, in einer nachgeordneten 
Verarbeitungsstufe ausgefiihrt wird. Dieser Prozess kann 
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auch als Hypothesengenerierung in einer ubergeordneten 
Verfahrensstufe angesehen werden, die in einer 
. nachgeordneten Verfahrensstufe uberpriift, d.h. bestatigt 
Oder zuruckgewiesen werden. Es wird ausdrCicklich darauf 
5 hingewiesen, dass die Hypothesen, welche an sich in einer 
ubergeordneten Verfahrensstufe (Grobklassif izierung) 
erstellt worden sind, auch mit anderen Informationen, 
insbesondere mit manuellen Mitteln, wie Fernbedienungen 
Oder Schalter, eingegeben werden konnen. In Fig. 3 ist 

10 dies, stellvertretend in der ersten Verarbeitungsstuf e SI, 
mittels einer Stellgrosse ST angegeben> uber die 
beispielsweise die Berechnungen in der 
Klassif izierungseinheit CI ubersteuert werden konnen. 
Selbstverstandlich kann die Stellgrosse auch einer 

15 Klassif izierungseinheit C2 bis Cn oder einer 

Nachverarbeitungseinheit PI bis Pn einer anderen 
Verfahrensstufe SI bis Sn zugefuhrt werden. 

In einetn erf indungsgemassen Klassif izierungssys tern mit 
20 mehreren Verarbeitungsstuf en SI bis Sn kann jeder 

Verarbeitungsstuf e SI bis Sn,. was jedoch nicht zwingend 
ist, eine Aufgabe zugeordnet werden, wie zum Beispiel: 
eine Grobklassif izierung, eine Feinklassif izieirung, eiiie 
Lokalisierung einer Gerauschquelle, eine Uberprufung, ob 
25 eine bestimmte Gerauschquelle, z. B. Automobilgerausch in 
einem Fahrzeug, vorhanden ist, oder eine Extraktion von 
bestimmten Signalanteilen von einem Eingangssignal, z. B. 
. Elimination von Echo unter Bervicksichtigimg von 
Raumcharakteristiken. Die einzelnen Verfahrensstufen SI 
30 bis Sn sind daher indiyiduell im Sinne, dass in ihnen 
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verschiedene Merkmale extrahiert land verschiedene 
Klassif izierungsmethoden verwendet werden. 

In einem weiteren Anwendungsbeispiel ist vorgesehen, in 
5 einer ersten Verarbeitungsstuf e SI ein individuelles 

Signal in einem Gemisch von verschiedenen Signalanteilen 
2U lokalisieren, in einer zweiten Verarbeitungsstuf e S2 
eine Grobklassifizierung der lokalisierten Si'gnalquelle 
vorzunehmen und in einer dritten Verf ahrenstuf e S3 eine 
10 Feinklassif izierung der in der zweiten Verfahxensstuf e S2 
erhaltenen groben Klass if izierung vorzunehmen. 

Die in der ersten Verarbeitungsstuf e diirchgef iihrte 
Lokalisation der Schallquelle kann eine 
15 Richtungsf ilterung, zum Beispiel mittels Multi-Mikrof on- 
Technologie, nachgeschaltet werden. 

Selbstverstandlich kann eine Merkmalsextraktionseinheit Fl 
bis Fn unter mehreren Klassif izierxingseinheiten CI bis Cn 

20 aufgeteilt werden, d.h. die Resultate einer 

Merkmalsextraktionseinheit Fl bis Fn konnen von mehreren 
Klassif izierungseinheiten CI bis Cn verwendet werden. Des 
weiteren ist denkbar, dass eine Klassif izierungseinheit CI 
bis Cn in mehreren Verarbeitungsstuf en SI bis Sn verwendet. 

25 wird. Schliesslich kann vorgesehen sein, dass die in den 
verschiedenen Verarbeitungsstuf en SI bis Sn erhaltenen 
Klasseninf ormationen KIl bis Kin bzw. die bereinigt^n 
Klasseninformationen KIl' bis Kin* zur Erhaltung der 
abschliessenden Klassif izierung unterschiedlich gewichtet 

30 werden. 
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. In Fig. 4 ist eine weitere Ausfiihrungsform der Erf indiing 
dargestellt, bei der wiederum mehrere Verarbeitungsstufen 
SI bis Six zum Einsatz kommen. Im Unterschied zur 
5 Ausfuhrvingsform gemass Fig, . 3 werden die 

Klasseninformationen KIl bis Kin nicht nur in den jeweils 
unmittelbar nachfolgenden Verarbeitungsstufen verwendet, 
sondern gegebenenfalls in alien untergeordneten 
Verarbeitungsstufen. In analoger Weise konnen die 
10 Resultate von vorhergehenden Verarbeitungsstufen SI bis Sn 
ihre Auswirkungen auch auf die nachfolgenden 
Merkmalsextraktionseinheiten Fl bis Fn bzw. auf die zu 
extrahierenden Merkmale haben. 

15 Auch bei der Ausfiihrungsvariante gemass Fig- 4 sind 
Nachverarbeitungseinheiten PI bis Pn denkbar, die 
Zwischenresultate der Klassif izierung aufbereiten und als 
bereinigte Klasseninformationen KIl' bis Kin' zur 
Verfiigung stellen. 

20 

In Fig. 5 ist eine weitere Ausfiihrungsvariante einer 
mehrstufigen Vorrichtung zur Bestimmung der akustischen 
Umgebungssituation, wiederum in allgemeiner Form, 
dargestellt. Gezeigt sind wie bereits bei den 

25 Ausfiihrungsvarianten gemass Fig. 3 und 4 mehrere 
Verarbeitungsstufen SI bis Sn mit 
Merkmalsextraktionseinheiten Fl bis Fn und 
Klassif izierungseinheiten CI bis Cn. Die in jeder 
Verarbeitungsstufe SI bis Sn erhaltenen 

30 Klasseninformationen KIl bis Kin werden einer 
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Entscheidungseinheit FD zugefuhrt, in der die 
abschliessende Klassif izierung durch erzeugen der 
Klasseninformationen KI vorgenommen wird. . In der 
Entscheidungseinheit FD ist gegebenenfalls vorgesehen, 
5 Riickkopplungssignale zu erzeugen, welche auf die 

Merkmalsextraktionseinheiten Fl bis Fn und/oder auf die 
Klassif izierungseinheiten CI bis Cn wirkeii; urn 
beispielsweise einzelne Parameter in diesen 
Verarbeitungseinheiten anzupassen oder urn ganze 
10 Klassifizierungseinheiten CI bis Cn austauschen zu konnen. 

Es wird ausdrucklich darauf hingewiesen, dass die 
Ruckwirkungen und Verkniipfungen der Verarbeitungseinheiten 
der Ausfuhrungsvarianten gemass Fig, 3 bis 5 nicht auf die 
15 dargestellten Varianten beschrankt sind. Denkbar ist, dass 
einzelne Ruckwirkungen oder Verkniipfungen weggelassen 
werden, Grundsatzlich sind beliebige Kombinationen von 
Verarbeitungseinheiten und Stanikturen moglich. 

20 Dariiber hinaus ist denkbar, dass - beim Einsatz der 
Erfindung bei Horhilf egeraten - die verschiedenen 
Verarbeitungsstuf en auch zwischen zwei Horgeraten, d.h. 
bei je einem Horgerat fur das linke und das rechte Ohr, 
verteilt sind. Der Inf ormationsaustausch erfolgt bei 

25 dieser Ausf uhrungsf orm uber eine drahtgebundene oder eine ' 
drahtlose Ubertragungsstrecke . 

In Fig. 6 ist nochmals eine vereinfachte 
Ausfiihrungsvariante der Erfindvmg zur Veranschaulichung 
30 der vorstehenden allgemeinen Ausfuhrungen zu den moglichen 
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Sfcrukturen. Obwohl lediglich eine 

Merkmalsextraktionseinheit Fl vorgesehen ist, sind zwei 
Verarbeitungsstuf en SI xind S2 vorgesehen. Die erste 
Verarbeitiingsstuf e SI besteht aus der 
5 Merkmalsextraktionseinheit Fl und der 

Klassif izierungseinheit CI. Bei der zweiten 
Verarbeitungsstufe S2 werden die gleichen Merkmale 
verwendet, die bereits in der ersten Verf ahrensstufe SI 
verwendet worden. sind. Bine Neuberechnimg der Merkmale in 

10 der Verfahrensstufe S2 eriabrigt sich daher, und es konnen 
die Resuitate der Merkmalsextraktionseinheit Fl der ersten 
Verfalirensstufe SI in der zweiten Verfahrensstufe S2 
verwendet werden. In der zweiten Verfahrensstufe S2 wird 
somit lediglich die Klassif izierungsmethode geandert, \ind 

15 zwar in Abhangigkeit der Klasseninformationen KIl der 
ersten Verarbeitungsstuf e SI. 

Fig. 7 zeigt die Verwendung der erf indungsgemassen 
Vorrichtung bei einem Horhilf egerat , das im Wesentlichen 

20 eine Ubertragungseinheit 200 aufweist. Mit 100 ist eine 
mehrstufige Verarbeit\ingseinheit bezeichnet, die geraass 
einer der in den Fig. 2 bis 6 dargestellten 
Ausfuhrvmgsvarianten realisiert ist. Das Eingangs signal IN 
wird sowohl der mehrstuf igen Verarbeitungseinheit ICQ als 

25 auch der Ubertragungseinheit 200 beauf schlagt, in dem das 
akustische Eingangssignal IN unter Zuhilfenahme der in der 
mehrstufigen Verarbeitungseinheit 100 erzeugten 
Klasseninformationen KIl bis Kin bzw. KI1» bis Kin* 
bearbeitet wird. Dabei ist vorzugsweise vorgesehen, ein. 

30 aufgrund der ermittelten akustischen Umgebungs situation 
ein geeignetes Horprogramm auszuwahlen, wie dies in der 
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Einleitung und in der international en Patentanmeldung WO 
01/20 965 beschrieben worden ist. 

Mit 3 00 ist eine manuelle Eingabeeinheit bezeichnet, mit 
5 Hilfe der - beispielsweise uber sine Funkstrecke, wie dies 
schematisch in Fig. 7 ersichtlich ist - gegebenenf alls 
sowohl auf die mehrstufige Verarbeitungseinheit 100 in 
bereits erlauterten Weise oder auf die Ubertragungseinheit 
200 einwirkt. Im Falle des Horhilf egerates 200 wird auf 
10 die Ausfuhrungen in der WO OI/20 965 verwiesen, deren 

Inhalt als integrierter Bestandteile dieser Beschreibung 
anzusehen ist. 

Als mogliche Klassif izierxingsmethoden bei alien 
15 erlauterten Ausfiihrungsvarianten der Erf indung kommt . 
insbesondere eine der fblgenden Methoden zur Anwendung: 

- Hidden Markov Modelle; 

- Fuzzy Logic; 

20 - Klassif izierung nach Hayes; 

- Regel-basierte Klassif izierung; 

- Neuronale Netzwerke; 

- Minimale Distanz. 

25 Schliesslich wird ausdriicklich darauf hingewiesen, dass in 
den Merkmalsextraktionseinheiten Fl bis Fn (Fig. 2 bis 7) 
technische und/oder auditorisch-basierte Merkmale 
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extrahiert werden konnen. Fiir ausfiihrliche Brlauterungen 
2U den technischen und auditorisch-basierten Merkmalen sei 
wiederum auf die Ausfiihrungen in der interna tionalen 
Patentanmeldung WO 01/20 965 yerwiesen. 

5 . 

Als bevorzugte Anwendung; des erf indungsgemassen Verfahrens 
zur . Bestimmung der akustischen Umgebungs situation is t die 
Wahl eines Horprogrammes in einem Horhilfegerat. Denkbar 
ist jedoch auch die Verwendung der erf indungsgemassen 
10 Vorrichtung bzw, die Anwendung des erf indungsgemassen 
Verfahrens zur Spracherkennung . 
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Pabentanspruche : 



1. Verfahren zur Bestimmung einer akustischen 
5 Umgebungssituation, wobei das Verfahren darin besteht, 
dass in mindestens zwei Verarbeitungsstuf en (SI, . . . , Sn) 
ein vorzugsweise mit Hilfe mindestens eines Mikrofons 
aufgenommenes akustisches Eingangs signal (IN) verarbeitet 
wird, \md zwar derart, 

10 - dass in mindestens. einer der mindestens zwei 
Verarbeitiingsstuf en (Si, Sn) eine 

Extraktionsphase vorgesehen ist, in der 
charakteristische Merkmale aus dem Eingangs signal 
(IN) extrahiert werden, und 

15 - dass in jeder Verarbeitungsstuf e (SI, Sn) eine 

Identif ikationsphase vorgesehen ist, in der 
extrahierte charakteristische Merkmale klassif iziert 
werden, 

wobei aufgrund der Klassif izierung der Merkmale in 
20 mindestens einer Verarbeitungsstuf e (SI, •-•/ Sn) 

Klasseninformationen (KIl, . . . , Kin; KIl ' , . . . , Kin' ) 
erzeugt werden, welche die akustische Umgebungs situation 
charakterisieren bzw. identif iziert . 

25 2. Verfahren nach Anspruch 1, dadurch gekennzeichnet , dass 
in jeder Verarbeitungsstuf e (SI, Sn) eine 

Extraktionsphase vorgesehen ist, in der charakteristische 
Merkmale aus dem Eingangs signal (IN) extrahiert werden. 
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3. Verfahren nach Anspruch 1 oder 2, dadurch 
gekennzeichnet , dass aufgrund von in einer 
Verarbeitvmgsstuf e (SI, . . . , . Sn) erhaltener 
Klasseninformationen (KIl, Kin; KIl', Kin') die 

5 Art der Verarbeitung in einer anderen Verarbeitungsstufe 
(SI, Sn) gewahlt wird. 

4. Verfahren nach Anspruch 2 oder 3, dadurch- 
gekennzeichnet; dass die in der Identif ikationsphase einer. 

10 Verarbeitungsstufe i (Sl, Sn) erhaltenen 

Klasseninformationen (KIl, . . . , Kin; KIl* , , , , , Kin' ) die 
Art der Verarbeitung in der nachfolgenden bzw. 
untergeordneten Verarbeitungsstufe i+1 (SI, Sn) 
bestimmen. 

15 

5. Verfahren nach Anspruch 4, dadurch gekennzeichnet, dass 
aufgrund der in der Verarbeitungsstufe i (SI, Sn) 
erhaltenen Klasseninformationen (Kll, . . . , Kin; Kll» , . . . , 
Kin') spezifische Merkmale in der Extraktionsphase der 

20 nachfolgenden bzw. untergeordneten Verarbeitungsstufe i+1 
(SI, Sn) und/oder spezifische 

Klassifizierungsverfahren in der Identif ikationsphase der 
nachfolgenden bzw. untergeordneten Verarbeitungsstufe i+1 
(SI, Sn) gewahlt werden, 

25 

6. Verfahren nach einem der vorangehenden Ansprviche, 
dadurch gekennzeichnet, dass in der Identif ikationsphase 
eines der folgenden Klassifizierungsverfahren zum Einsatz 
kommt: 
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- Hidden Markov Modelle; 

- Fuzzy Logic; 

- Klassif izierung nach Bayes; 

- Regel-basierte Klassif izierung; 
5 - Neuronal e Netzwerke; 

- Minimale Distanz. 

7. Verfahren nach einem der vorangehenden Anspriiche, 
dadurch gekennzeichnet, dass in den Extraktionsphasen 

10 technische und/oder auditorisch-basierte Merkmale 
extrahiert werden, 

8. Verfahren nach einem der vorangehenden Anspriiche, 
dadurch gekennzeichnet , dass in mindestens einer 

15 Verarbeitungsstuf e (SI, Sn) im Anschluss an die 

Extraktionsphase eine Nachverarbeitungsphase vorgesehen 
ist, in der die Klasseninf ormationen (KIl, Kin) zur 

Erzeugung von bereinigten Klasseninf ormationen (KI1\ 
Kin') nachbearbeitet werden. 

20 

9. Anwendung des Verfahrens nach einem der Anspruche 1 bis 
8 zur Anpassung mindestens eines Horhilf egeraces an eine 
momentane akustische Umgebungssituation. 

25 10. Anwendung nach Anspruch 9, dadurch gekennzeichnet, 
dass aufgrund der ermittelten momentanen akustischen 
Umgebvmgssituation ein Horprogramm bzw. eine 
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IJbertragungsfvinktion zwischen mindestens einem Mikrcfon 
und einem Hdrer im mindestens einen Horhilf egerat 
eingestellfe wird. . ■ 

.5 11. Anwendung des Verfahrens nach einem der Anspriiche 1 
bis 8 . zur Spracherkennxing . 

12. Vorrichtung zur Bestimmung einer akustischen 
Umgebungssituation mit einer Merkmalsexfcraktionseinheit 

10 (M) , das mit einer Klassif izierungseinheit (C) zur 

Verarbeitiang eines Eingangssignals (IN) wirkverbunden ist, 
dadurch gekennzeichnet , dass mindestens zwei 
Verarbeitungsstufen (SI, Sn) vorgesehen sind, wobei 

in mindestens einer der mindestens zwei 

15 Verarbeitungsstufen (SI, . . . , Sn) eine 

Merkmalsextraktionseinheit (Fl, Fn) enthalten ist und 

wobei in jeder Verarbeitungsstufe (SI, Sn) eine 

Klassif izierungseinheit (CI, Cn) enthalten ist, dass 

das Eingangssignal (IN) den Merkmalsextraktionseinheiten 

20 (Ml, Mn) beaufschlagt ist und dass mit den 

Klassif iziereinheiten (CI, Cn) Klasseninf ormationen 

(KIl, Kin) erzeugbar sind. 

' 13. Vorrichtung nach Anspruch 12, dadurch gekennzeichnet , 
25 dass in jeder Verarbeitungsstufe (Si, Sn) eine 

Merkmalsextraktionseinheit (Ml, Mn) vorgesehen ist. 



14. Vorrichtung nach Anspruch 12 oder 13, dadurch 
gekennzeichnet, dass die Klasseninf ormationen (KIl, 
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Kin; KIl*, Kin') einer anderen Verarbeituncfsstufe 

(SI, . . . , Sn) beaufschlagt sind. 

15. Vorrichtung nach einem der Anspruche 12 bis 14, 
5 dadurch gekennzeichnet , dass die Klasseninf ormationen 

(KIl, ... I Kin; KI1» , . . . , Kin' ) einer Verarbeitungsstufe 
i (SI, Sn) der nachf olgenden bzw. iibergeordneten 

Verarbeitungsstufe i+1 (SI, Sn) beaufschlagt sind. 

10 16 . Vorrichtung nach Anspruch 15, dadurch gekennzeichnet , 
dass die Klasseninf ormationen (KIl, Kin; KIl', .. 

Kin') einer Verarbeitungsstufe i (SI, . . . , Sn) der 
Merkmalsextraktionseinheit (Ml, Mn) einer 

nachf olgenden bzw, untergeordneten Verarbeitungsstufe i+1 

15 (SI, Sn) und/oder der Klassif izierungseinheit (CI, 

Cn) der nachf olgenden bzw. untergeordneten . 
Verarbeitungsstufe i+1 (SI, . . . , Sn) beaufschlagt sirid. 

.17. Vorrichtung nach einem der Anspruche 12 bis 16, 
20 dadurch gekennzeichnet, dass in mindestens einer 
Verarbeitungsstufe (SI, Sn) die erhaltenen 

Klasseninf ormationen (KIl, Kin) einer 

Nachverarbeitungseinheit (PI, Pn) zur Erzeuguiig von 

bereinigten Klasseninf ormationen (KIl ' , . . . , Kin' ) 
25 beaufschlagt sind. 

18 . Vorrichtung nach Anspruch 12 oder 13 , dadurch 
gekennzeichnet, dass die Klasseninf ormationen (KIl, ... , 
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Kin) aller Verarbeitungsshufen (SI, Sn) einer 

Entscheidimgseinheit (ED) beaufschlagt sind. 

19. Vorrichtung nach Anspruch 18, dadurch gekennzeichnet > 
. 5 dass die Entscheidimgseinheit (ED) mit mindestens einer 
Merkmalsextraktionseinheit (Fl; Fn) und/oder mit 

mindestens einer Klassif izierungseinheit (CI, Cn) 
wirkverbunden ist. 

10 20. Horhilfegerat mit einer Ubertragungseinheit (200), die 
eingangsseitig mindestens mit einem Mikrofon und 
ausgangsseitig mit einer Wandlereinheit, insbesondere 
einem Horer, wirkverbunden ist, und mit einer Vorrichtung 
nach einem der Anspriiche 12 bis 17 zur Erzeugung von 

15 Klasseninformationen (KIl, . . . , Kin; KIl ' , . . • , Kin' ) , 

wobei die Klasseninf orinationen (KIl, , . . , Kin; KIl' , . . . , 
Kin') der Ubertragungseinheit (200) beaufschlagt sirid. 

21. Horhilfegerat nach Anspruch 20, dadurch 
20 gekennzeichnet, dass eine Eingabeeinheit (300) vorgesehen 
ist, die, vorzugsweise liber eine Fiinkstrecke, mit der 
Ubertragungseinheit (200) und/oder mit der Vorrichtvmg 
nach einem der Anspruche 12 bis 17 wirkverbunden ist.. 
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